其他
通过 Python 代码实现时间序列数据的统计学预测模型
The following article is from DeepHub IMBA Author P**nHub兄弟网站
在本篇中,我们将展示使用 Python 统计学模型进行时间序列数据分析。 目标是:根据两年以上的每日广告支出历史数据,提前预测两个月的广告支出金额。
df1 = data[['Date','Spend']].set_index('Date')
train = df1.iloc[:933,:]
test = df1.iloc[933:,:]
test.shape,train.shape
(63,1)
;训练集大小:(933,1)
。统计模型与统计要素
时间序列分析常用统计模型
单变量时间序列统计学模型,如:平均方法、平滑方法、有/无季节性条件的 ARIMA 模型。
多变量时间序列统计学模型,如:外生回归变量、VAR。
附加或组件模型,如:Facebook Prophet、ETS。
结构化时间序列模型,如:贝叶斯结构化时间序列模型、分层时间序列模型。
单变量时间序列统计学模型的关键要素
变换,如:取对数、取平方等。
平滑处理,如:移动平均等。
差分。
分解。
多项式拟合,如:拟合回归。
ARIMA:差分整合移动平均自回归模型
ARIMA(p,d,q)
主要包含三项:p d q
三项参数,并按照顺序执行。ARIMA 模型也可以用于开发 AR, MA 和 ARMA 模型。ACF 和 PACF 图
通过 PACF 图可以确定 p
通过 ACF 图可以确定 q
SARIMA
SARIMA(p,d,q)(P,D,Q)s
,其中P,D,Q
为季节参数,s
为时间序列周期。案例:通过 SARIMA 预测广告支出
test_stationarity
来检查时间序列数据的平稳性。 test_stationarity
函数,可以绘制移动平均值以及标准差,并且通过 Augmented Dickey-Fuller test 输出 P 值。df1[‘log_Spend’]=np.log(df1[‘Spend’])
,时间序列在阈值为5%时满足平稳性要求。test_stationarity(df1[‘Spend’].diff(1).dropna())
。import statsmodels.api as sm fit1 = sm.tsa.statespace.SARIMAX(train.Spend, order=(7, 1, 2), seasonal_order=(0, 1, 2, 7)).fit(use_boxcox=True) test['SARIMA'] = fit1.predict(start="2019-07-23", end="2019-09-23", dynamic=True) plt.figure(figsize=(16, 8)) plt.plot(train['Spend'], label='Train') plt.plot(test['Spend'], label='Test') plt.plot(test['SARIMA'], label='SARIMA') plt.legend(loc='best') plt.show()
sklearn.metrics
包导入 mean_squared_error,mean_absolute_error
函数计算 mse 和 mae 来检查这个模型的性能。结果如下:ETS:指数平滑法
ETS,Exponential Smoothing
Linear:双指数平滑;
Additive:三指数平滑;
Multiplicative:三指数平滑。
Holt-Winter 季节性预测算法
案例:通过 Holt-Winter 季节性预测算法预测广告支出
from statsmodels.tsa.api import ExponentialSmoothing fit1 = ExponentialSmoothing(np.asarray(train['Spend']) ,seasonal_periods=7 ,trend='add', seasonal='add').fit(use_boxcox=True)test['Holt_Winter'] = fit1.forecast(len(test)) plt.figure(figsize=(16,8)) plt.plot( train['Spend'], label='Train') plt.plot(test['Spend'], label='Test') plt.plot(test['Holt_Winter'], label='Holt_Winter') plt.legend(loc='best') plt.show()
mean_squared_error,mean_absolute_error
函数查看 mse 和 mae。算法对比
结束语
欢迎所有开发者扫描下方二维码填写《开发者与AI大调研》,只需2分钟,便可收获价值299元的「AI开发者万人大会」在线直播门票!
前百度主任架构师创业,两年融资千万美元,他说AI新药研发将迎来黄金十年 北京四环堵车引发的智能交通大构想 400 多行代码!超详细中文聊天机器人开发指南 | 原力计划 三大运营商将上线 5G 消息;苹果谷歌联手,追踪 30 亿用户;jQuery 3.5.0 发布 | 极客头条 比特币当赎金,WannaRen 勒索病毒二度来袭! 你公司的虚拟机还闲着?基于 Jenkins 和 Kubernetes 的持续集成测试实践了解一下! 从 Web 1.0到Web 3.0:详析这些年互联网的发展及未来方向
你点的每个“在看”,我都认真当成了AI